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(§) Verfahren zur Verbesserung der Zuverlassigkeit von Sprachsteuerungen von Funktionselementen und 
Vorrichtung zu dessen Durchfuhrung 

Bei einem Verfahren und einer Vorrichtung zur slcheren 
Erkennung mindestens des Beginns eines Sprachbefehls fur 
eine Sprachsteuerung von Funktionselementen werden Si- 
gnale eines mrt Korperschall einer Bedienperson beauf- 
schlagten erst en Mikrofons zur Triggerung eines auf den 
Mund der Bedienperson ausgerichteten zweiten Mikrofons 
verwendet, um die Zuverlassigkeit der Sprachsteuerung bei 
Nebengerauschbelastung zu verbessern. 
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Patentanspruche 

1. Verfahren zur Verbesserung der Zuveriassigkeit . 
von Sprachsteuerungen von Funktionselementen 
an Arbeitsplatzen oder in Kraftfahrzeugerj, durch 5 
Vorkehrungen zur sicheren Erkennung des Beginns 
von Sprachbefehlen in einer Spracherkennungs- 
schaltung, 

wobei ein «rstes Mikrqfon voraehmlich mit beim 
Sprechen erzeugtem Schall beaufschlagt wird 10 
. und ein zweites Mikrofon wenigstens mit Nebenge- 
rauschen beaufschlagt wird 

und wobei in beiden Mikrofonen erzeugte Signale 
elektrisch in eine bestimmte Beziehung zueinander 
gebracht werden, urn eine falschliche Interpreta- 15 
tion eines f einen Nebengerauschs als Sprachbefehl 
zu verjiindern, 
dadurch gekennzeichnet, 

daB das erste Mikrofon mit beim Sprechen erzeug- 
tem Kdrperschall einer Bedienperson beaufschlagt 20 
wir d und 

daB das zweite Mikrofon, welches mit raumlichem 
Abstand auf den Mund der Bedienperson ausge- 
richtet ist und dadurch ferner mit beim Sprechen 
erzeugtem Schall beaufschlagt wird, nur dann elek- 25 
trisch zur Sprachsignaliibertragung auf die Sprach- 
erkennungsschaltung geschaltet wird, wenn das er- 
ste Mikrofon aus dem Korperschall seinerseits Si- 
gnale erzeugt. 

2. Vorrichtung zur Durchfuhrung des Verfahrens 30 
nach Anspruch 1 

mit einem ersten, vornehmlich mit beim. Sprechen 
erzeuigten Schallwellen beaufschlagbaren Mikro^ 
fen, 

mit einem zweiten, wenigstens mit Nebenger&u- 35 
schen beaufschlagbaren Mikrofon und 
mit einer elektrischen Schaltung, welche eine be- 
stimmte Beziehung zwischen von den beiden Mi- 
krofonen erzeugten elektrischen. Signalen herstelit 
und einer Spracherkennungsschaltung Ausgangssi- 40 
gnale zuftthrt, 
dadurch gekennzeichnet, 

daB das erste Mikrofon (2) als an eiriem Korperteil 
einer Bedienperson ahliegendes Korperschallmi- 
krofon ausgebildet ist, 45 
daB das zweite Mikrofon (5) mit raumlichem Ab- 
stand auf den Mund der Bedienperson ausgerichtet 
ist und ferner mit beim Sprechen. erzeugtem Schall 
beaufschlagt wird, und 

daB die elektrische Schaltung als durch vom ersten 50 
Mikrofon (2) erzeugte Signale ansteuerbare Trig- 
gerschaltung (10) zur Herstellung einer Schaltbe- 
ziehung zwischen Signalen des ersten (2) und des 
zweiten Mikrofons (5) ausgebildet ist, welche 
Schaltbeziehung eine Zufiihrung von Signalen miri- 55 
destens des zweiten Mikrofons (5) als Ausgangssi- 
gnale zur Spracherkennungsschaltung (14) nur 
dann ermdglichti werm gleichzertig Signale des er- - 
sten Mikrofons (2) an der Triggerschaltung (10) an- 
iiegen. . 60 

3. Vorrichtung nach Anspruch 2, dadurch gekenn- 
zeichnet, daB das erste Mikrofon (2) ein an den Hals 
der Bedienperson anlegbares Kehlkopfmikrofon 
ist 

4. Vorrichtung nach Anspruch 3, dadurch gekenn- 65 
zeichnet, daB beide Mikrofdne (2, 5) an Geschirren 
(li 3) befestigt sihd, die von der Bedienperson ange- 
legt werden konnen. 
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5. Vorrichtung nach Anspruch 2, dadurch gekenn- 
zeichnet, daB ferner ein von der Bedienperson zu 
tragendes Gehause (9) zur Aufnahme 

— der mit beiden Mikrofonen (2, 5) elektrisch 
verbundenen Triggerschaltung (10% 

— eines Senders (11) zur drahtlosen Obertra- 
gung von Ausgangssignalen der Triggerschal- 
tung (10) an einen Empfanger (13) der Sprach- 
erkennungsschaltung (14) und 

— eines elektrischen Energiespeichers (12) zur 
Speisung mindestens der Triggerschaltung (10) 
und des Senders (11) 

vorgesehen ist 

6; Vorrichtung nach Anspruch 2, dadurch gekenn- 
zeichnet, daB die Signale des ersten Mikrofons (2) 
ferner zur Optimierung der Erkennbarkeit der Si- 
gnale des zweiten Mikrofons (5) mit diesen elek- 
trisch verknflpft werden. 

7. Vorrichtung nach Anspruch 2, dadurch gekenn- 
zeichnet, daB ein Zeitglied (T) mit auf die rhaximale 
Wortempfangsdauer der Spracherkennungsschal- 
tung (14) einstellbarer Zeitkonstante vorgesehen 
ist, welches die Zufflhrung von Ausgangssignalen 
der Triggerschaltung (10) zur Spracherkennungs- 
schaltung nach Ablauf der eingestellten Zeitkon- 
stante unterbricht 

8. Vorrichtung nach Anspruch 7,. dadurch gekenn- 
zeichnet, daB ein Signalgeber (103; 4) vorgesehen 
ist, welcher beim Ablauf der Zeitkonstante zur Er- 
zeugung eines Signals an die .Bedienperson akti- 
viertwircL 

9. Vorrichtung nach Anspruch 2, dadurch gekenn- 
zeichnet, 

daB die. Triggerschaltung (10) eineq Schwellwert- 
schalter (10.1) aufweist, welcher die elektrischen 
Signale des ersten Mikrofons (2) mit einem einstell- 
baren Schwellwert vergleicht und 
daB ein von dem Schwellwertschalter (10.1) bei 
ttber dem Schwellwert liegenden Signalen des er- 
sten Mikrofons (2) schlieBbarer . Schalter (10.2) in 
den Weg der elektrischen Signale des zweiten Mi- 
krofons (5) eingeschleiftist 

10- Vorrichtung nach Anspruch 5, dadurch gekenn- 
zeichnet, 

daB das Gehause (9) einen ersten Gehauseteil (9;1) 
zur Aufnahme der Triggerschaltung (10) und einen 
zweiten Gehauseteil (9.2) zur Aufnahme des Sen- 
ders (11) und des Energiespeichers (12) aufweist 
und 

daB die Triggerschaltung (10) mit dem Sender {11) 
und dem Energiespeicher (12) elektrisch mittels ei- 
ner zwischen den beiden Gehauseteilen (9.1, 9.2) 
angeordneten und diese kuppelnden mehrpoligen 
Steckverbindung (15; Fig. 2) verbunden ist 
1.1. Vorrichtung nach Anspruch 9, dadurch gekenn- 
zeichnet, daB das Zeitglied (7) in den elektrischen 
Schalter (10.2) integriert ist 
12. Vorrichtung nach Anspruch 2, dadurch gekenn- 
zeichnet, daB in eine Verbindung (6) zwischen dem 
ersten Mikrofon (2) und der Triggerschaltung (10) 
ein manuell zu betatigender Unterbrecherschalter 
(6.1) eingeschleiftist 

Beschreibung 

Die Erfindung bezieht sich auf ein Verfahren nach 
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dem Oberbegriff des Verfahrensanspruchs 1 und auf ei- Da beim Sprechen erzeugter Kdrperschall mit au- 

ne Vorrichtung zur Durchfuhrung des erfindungsgema- Berst geringem Zeitverzug am Kopf oder Hals, speziell 

Ben Verfahrens, welche die Merkmale des Oberbegriffs am Kehlkopf der Bedienperson, abgenommen werden 

des Vorrichtungsanspruchs 2 aufweist kann, eignet sich ein durch ein Korperschallmikrofon 

Ein gattungsgemaBes Verfahren laBt sich aus der Ar- 5 erzeugtes Signal sehr gut dazu, den Beginn eines 

beitsweise einer aus der DE-OS 36 10 797 bekannten Sprachbefehls zu erfassen. Das eigentliche Sprachmi- 

Vorrichtung herleitea Diese enthalt bereits ein Sprach- krofon, welches auch mit NebengerSuschen beauf- 

mikrofon und ein Nebengerauschmikrofon, deren Si- schlagt wird, kann durch das Korperschallsignal genau 

gnale durch elektrische Subtraktion zueinander in Be- zum Zeitpunkt des Sprachbefehlbeginns ohne Fehler- 

ziehung gesetzt werden. Bei der Subtraktion werden die 10 mdglichkeit elektrisch zur Sprachsignahlbertragung 

beiden Mikrofone gleichermaBen beaufschlagenden eingeschaltet werden. Die Bedienperson braucht dabei 

Gerauschanteile — insbesondere Nebengerausche — keinerlei willkttrliche Hand- oder Kopfbewegung zu 

eliminiert, so daB die resultierenden Restsignale ohne machen, weil nach einer Ausgestaltung der Vorrichtung 

weiteres als Sprachbefehle aufgefaBt werden konnen. beide Mikrofone an geeigneten Geschirren getragen 

Durch den Beginn des nach der Subtraktion verbleiben- 15 werden konnen. Sie ist auch nicht an irgendwelchen 

den Sprachsignals soli z.B. eine Umschaltung eines Bewegungsablaufen gehindert, vor allem dann nicht, 

Freisprechtelefons vom Empfangs- auf den Sendebe- wenn ferner noch ein tragbarer Sender vorgesehen ist, 

triebnurbeifechtemBedarf erfolgen. der die Sprachbefehle drahtlos zu einem entsprechen- 

Um den Anteil an Sprachschallbeaufschlagung des den Empfanger tibertrSgt 

Nebengerauschmikrofons beim Sprechen der Bedien- 20 Die elektrischen Signale des Korperschallmikrofons 

person moglichst gering zu halten, muB dieses in einiger sind zwar allein nicht hinreichend fttr die Spracherken- 

Entfernung vom Mund der Bedienperson angeordnet nung, weil sie z. B. keine Formanten und Nasallaute wie- 

sein. Daraus resultiert aber, dafl der Nebengerauschpe- dergeben konnen, aber sie konnen das tibertragene 

gel am Nebengerauschmikrofon nicht unbedingt dem Sprachmuster des Sprachmikrofons weiter verbessern, 

am Sprachmikrofon entspricht, so daB auch ohne 25 wenn sie mit dessen elektrischen Signalen in geeigneter 

Sprachbeaufschlagung des letzteren das Ergebnis der Weise verknQpft werden, z. B. durch phasengleiche Ad- 

Subtraktion der Signale beider stets auf Sendebereit- ' dition. 

schaft geschalteter Mikrofone nicht gleich Null sein Es ist ferner vorteihaft, daB das Sprachmikrofon im- 

muB. Daher ist eine Fehlsteuerung auch hier nicht aus- mer wieder automatisch abgeschaltet wird, wenn 

zuschlieBen. 30 Sprechpausen entstehen. Die Einschaltdauer kann auch 

Es sind ferner andere Vorrichtungen mit vergleichba- automatisch auf die zulassige Wortempfangsdauer der 

rer Funktion bekannt, die je ein einzelnes Sprachmikro- Spracherkennung beschrlnkt werden. Im letzteren Fall 

fon nur unter bestimmten Bedingungen auf Sendebe- erfolgt eine Signalisierung an die Bedienperson. 

reitschaft umschaltea Ein Ausfuhrungsbeispiel fflr eine erflndungsgernaBe 

In allgemein bekannter Weise geschieht das, indem 35 Vorrichtung ist in der Zeichnung dargestellt und wird im 

der Mikrofonbenutzer von Hand eine Sendetaste beta- folgenden n&her beschrieben. Es zeigt 

tigt Fig. 1 eine schematische Darstellung der Vorrichtung 

Aus der GB 20 03 002 A ist eine Vorrichtung bekannt, und 

die einen Senderschalter bei plotzlich ansteigendem Mi- Fig. 2 die Verschaltung der Mikrofone und der Trig- 

krofon-Eingangspegel automatisch schlieBt 40 gerschaltung in einem Blockschaltbild 

Aus der DE-OS 34 01 883 geht schlieBlich der Vor- An einem Halsgeschirr 1 ist ein an den Hals einer 

schlag hervor, ein Mikrofon mittels eines Annaherungs- nicht dargestellten Bedienperson anzulegendes erstes 

sensors — der die Annaherung des Kopfes der Bedien- Mikrofon 2 — als Doppel-Kehlkopfmikrofon ausge- 

person an das Mikrofon zum Sprechen erfaBt — auf fflhrt — befestigt An einem Kopfgeschirr 3, das zu ei- 

Sendebereitschaft umzuschalten. 45 nem Kopfhdrer 4 gehort, ist ein auf den Mund der Be- 

Bei all diesen Vorrichtungen wird immer lediglich ein dienperson auszurichtendes zweites Mikrofon 5 befe- 

(Sprach-)Mikrofon verwendet stigt Vom ersten Mikrofon 2 fflhrt eine Signalleitung 6, 

Ferner ist aus der US-PS 33 83 466 ein Verfahren zur in die ein manuell zu betatigender Unterbrecherschalter 

Spracherkennung bekannt, bei dem neben MeBfiihlern 6.1 eingeschleift ist, zum Kopfgeschirr 3 und wird von 

fur die Lippenbewegung einer Bedienperson und die 50 dort aus gemeinsam mit einer Signalleitung des zweiten 

Luftstromung zwischen ihren Lippen ein erstes Mikro- Mikrofons 5 in einem flexiblen Kabel 7 Ober eine mehr- 

fon am Kehlkopf und ein zweites in der Nase der Be- polige Steckverbindung 8 in ein erstes Gehauseteil 9.1 

dienperson angebracht sind Durch die beiden kompli- eines Gehauses 9 eingefflhrt 

zierten MeBfiihler und das Mikrofon in der Nase wird In dem ersten Gehauseteil 9.1 ist eine — hier nur 

dieses Verfahren fur den breiten Einsatz an Arbeitspiat- 55 schematisch mit einem Transistorsymbol dargestellte — 

zen oder in Kraftfahrzeugen ungeeignet . Triggerschaltung 10 angeordnet, welcher die elektri- 

Die Erfindung hat die Aufgabe, das Verfahren nach schen Signale der beiden Mikrofone 2 und 5 zugefQhrt 

dem Oberbegriff des Patentanspruchs 1 so zu verbes- werden. SchlieBlich ist noch ein Signalgeber 103 ange- 

sern, daB eine Deutung von reinen Nebengerauschen als deutet, der von einem in der Triggerschaltung 10 vorge- 

Sprachbefehlsbeginn sicher ausgeschlossen werden eo sehenen Zeitglied aktiviert werden kann und der Be- 

kann, und eine Vorrichtung zur Durchfuhrung des erfin- dienperson ein optisches oder akustisches Signal bei 

dungsgemaBen Verfahrens anzugeben. Oberschreitung der maxim alen Wortempfangsdauer ei- 

Diese Aufgabe wird erfindungsgemaB mit den kenn- ner Spracherkennungsschaltung 14 gibt 

zeichnenden Merkmalen des Verfahrensanspruchs 1 In einem zweiten Gehauseteil 9.2 des Gehauses 9 sind 

bzw. der Vorrichtung nach Anspruch 2 gelost 65 ein Sender 11 und ein elektrischer Energiespeicher 12 

Die UnteransprQche off enbaren mit ihren kennzeich- angeordnet Der Sender 11 korrespondiert mit einem 

nenden Merkmalen vorteilhafte Ausbildungen der erfin- Empfanger 13 der Spracherkennungsschaltung 14. An 

dungsgemaBen Vorrichtung. dem zweiten Gehauseteil 9.2 kann vorteilhaft ein Trage* 
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griff oder -gurt 15 angebracht sein. 

In dem stark vereinf achenden Blockschaltbild der 
Fig. 2 sind die den bereits erwahnten Schaltelementen 
der Vorrichtung entsprechenden Schaltsymbole mit 
gleichen Bezugsziffern versehen. 5 

Die Triggerschaltung 10 besteht im wesentlichen aus 
einem Schwellwertschalter 10.1 mit z. B. an einem Po- 
tentiometer einstellbarem Referenzwert und aus einem 
von dem Schwellwertschalter 10.1 steuerbaren Schlie- 
Berschalter 10.2, der hier in den Signalweg des zweiten io 
Mikrofons 5 eingeschleift ist. Der SchlieBerschalter 10.2 
enthalt vorteilhaft ein Zeitglied T t welches nach Ablauf 
der maximalen Worterapfangsdauer der Spracherken- 
nungsschaitung 14 den Schalter 10.2 dfthet und den Si- 
gnalgeber 1 0.3 zu dem erwahnten Zweck aktrviert . 15 

Der Sender 11 kann nach beliebigen Prinzipien der 
drahtlosenp Signalubertragung arbeiten. Als Beispiel ist 
eine Infrarotdiode eingezeichnet 

Ferner sind im ersten Gehauseteil 9.1 noch ein Ver- 
starker 16 fur die Signale des ersten Mikrofons 2 und ein 20 
Verstarker 17 fur die Signale des zweiten Mikrofons 5 
angeordnet 

Bei Beaufschlagung des ersten Mikrofons 2 mit Kor- 
perschall wird nach dem Ansprechen des Schwellwert- 
schalters 10.1 der Schalter 10.2 geschlossen bzw. dutch- 25 
lassig far die verstarkten und gefilterten Signale des 
zweiten Mikrofons 5. 

Sollte die Bedienperson sich rauspern oder husten 
mussen, kann sie mit dem Unterbrecherschalter ("Raus- 
pe^taste ,, ) 6.1 eine unerwunschte SignalQbertragimg 30 
verhindern. 

SchlieBlich kann ein akustisches Signal, das die Ober- 
schreitung der maximalen Wortempfangsdauer mar- 
kiert, der Bedienperson vorteilhaft auch tiber den Kopf- 
horer 4 statt iiber den direkt abstrahlenden Signalgeber 35 
103 zugefilhrt werden. 
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Increasing reliability of speech controls - triggering mouth microphone from signal originating 
from microphone responding to body sound of operator 

Patent Number : DE3742929 

International patents classification : G10L-003/00 Gl OL-007/08 H03G-003/20 H04B-003/00 H04B-01S/02 H04Q-009/00 

♦ Abstract : 

DE3 742929 C A first microphone (2) is fed with body sound forming speech by an operator. A second microphone (5) is spatially separated from the 
mouth of the operator so as to receive the speech sounds and also ambient noise. An electric circuit creates a set relation between the signals from the 
two microphones and feeds an output to a speech recognition circuit. It comprises a trigger circuit (10) making a switch relation between the two 
microphones so as feed a signal from at least the second microphone to the speech recognition circuit only when simultaneous signals from the first 
microphone appear at the trigger. 

The first microphone may be a larynx-microphone attached to the throat of the operator. Both microphones may be suspended from harnesses. 
USE - Ensures recognition of beginning of spoken command in speech recognition circuit. (2/2) 

US4901354 A The reliability of voice control systems is improved by reliablyy detecting the beginning of voice commands in a voice recognition 
circuit. Sound generated during speaking is applied to a first microphone with little ambient noise present and a second microphone some distance 
away. Misinterpretation of a pure ambient noise as voice command is prevented by signals generated in both microphones being electrically subtracted. 
Contact measurable sound generated during the speaking of an operating person is applied to the first microphone only direct contact The second 
microphone is directed towards the mouth of the operating person. As a result, sound generated during speaking is also applied. This microphone is 
electrically switched to the voice recognition circuit only when the first microphone generates signals from the contact measurable sound. 
USE/ AD VANTAGE - At work station or in motor vehicle. Better rejection of ambient noise allowing speech control of systems where operator is 
manually restricted. 
(6pp) 
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